09. 注意力编码器和解码器

在机器翻译应用中,编码器和解码器通常

SOLUTION: 递归神经网络(通常为 vanilla RNN、LSTM 或 GRU)

单词嵌入

对现实应用来说,比较合理的嵌入大小是多少?

SOLUTION: 200

在具有注意力机制的序列到序列模型中,哪些步骤需要计算注意力向量?

SOLUTION: 仅解码器的每个时间步